iT邦幫忙

2022 iThome 鐵人賽

DAY 29
0
AI & Data

16S rRNA 從次世代到三代定序-生資QIIME2資料分析趣系列 第 29

[Day 29] NGS TGS 定序分析報錯 : 那些分析時遇到的蟲子們

  • 分享至 

  • xImage
  •  

沒有寫過程式就不會遇到 BUG

本篇介紹執行定序分析常見的報錯情境,
而報錯的方式千百種,查詢解決方法就一種 :
錯誤訊息複製起來,扔到 Google 就對了
不過總有特別頑固又印象深刻的錯誤,
這邊分享幾種曾經遇過特別的報錯 :

  • An error was encountered while running DADA2 in R (return code 1)

    https://ithelp.ithome.com.tw/upload/images/20221014/20151510RWn4seUTKa.png

    Reference : forum.qiime2.org

    這應該是最常見也是頭最疼的一個報錯,
    DADA2 是負責品質管制的 R 套件,
    頭疼的原因是永遠報錯都是 return code 1(難道沒有其他數字了嗎 ! ),
    不會直接顯示真正的錯誤訊息,
    注意看會有一行紅字 :

    Debug info has been saved to /tmp/XXXXXXXX.log
    

    此時複製路徑並輸入 :

    head /tmp/XXXXXXXX.log
    

    就能夠一窺它壞掉的原因了Q,
    把裏頭真正錯誤訊息丟 Google 才找得到解法

    • 情境舉例 : 錯誤訊息 - Mismatched forward and reverse sequence files

      'Filtering Error in (function (fn, fout, maxN = c(0, 0), truncQ = c(2, 2), truncLen = c(0,  : Mismatched forward and reverse sequence files: 3296, 4292.'
      

      這情況會發生在抓取公開文獻的序列資料來分析時遇到的 Bug ,
      主因是 NGS 雙尾定序 (Pair-end)原始資料兩邊序列不等長,
      為什麼會不等長可能要問問作者或神奇海螺,
      解法如下 :

      1. 調出 QIIME2 錯誤報告資料夾

        qiime tools export \ 
        --input-path demux.qza \
        --output-path debugging 
        
      2. 切換到 debugging 資料夾

        cd debugging
        
      3. 列出該批待處理樣本檔名與序列長度資訊

        for f in *.fastq.gz; do r=$(( $(gunzip -c $f | wc -l | tr -d '[:space:]') / 4 )); echo $r $f; done
        
      4. 看起來會像是這樣 (示意圖) :

        https://ithelp.ithome.com.tw/upload/images/20221014/20151510KE6Qxc0SPP.png

      5. 回去一開始觀察錯誤訊息,若有3296, 4292 出現在列表中,
        建議直接到manifest.tsv 移除那對樣本
        不要分析它了,請學會放下它,執著並不符時間成本。
        Reference : forum.qiime2.org

  • Alpha Beta 多樣性分析結果,有樣本缺失 (E.g. 跑5個出來4個點)

    這是因為取樣深度 (sampling depth) 調得太高的關係,
    觀念參閱 [Day 15] !

    • NGS QIIME2 次世代定序分析
      解法 : 參閱 [Day 16]

    • TGS pb-16S-nf 第三代定序分析
      results/rarefaction_depth_suggested.txt 含有程式預設取樣深度,
      若這個深度超過了一些樣本序列,就會被刪除,
      例如預設 18590 ,結果有個 sample 是 18451,
      該樣本就會在後續的分析被消失,:

      https://ithelp.ithome.com.tw/upload/images/20221014/20151510mZRFPll03o.png

      可於 results/visualize_biom.html 找到該圖

      解法 : 參閱 [Day 26]

時間過得很快,即將迎來系列文的最後一篇,希望到這裡的你對定序分析有了基本認識,對於錯誤的出現也能更從容應對 : D


上一篇
[Day 28] 統整 TGS 第三代定序 16S rRNA 生資分析學習地圖
下一篇
[Day 30] 微生物基因組 16S rRNA 生資定序分析 : 教學資源分享
系列文
16S rRNA 從次世代到三代定序-生資QIIME2資料分析趣33
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言